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摘 要 : 以 滑 干 河 一 库 车 河 绿洲 ( 渭 一 库 绿 洲 ) 为 研究 区 ,采用 在 机 器 学 习 方 面具 有 明显 优势 的 随机 森林 回归 算 
法 ,对 绿洲 内 的 4 种 典型 植被 (棉花 .芦苇 . 杨 树 、 大 素 ) 叶 片 的 叶绿素 相对 含量 (soil and plant analyzer development, 
SPAD) 进行 估算 和 验证 。 首 先 基于 “ 红 边 ”处 光谱 信息 丰富 的 哨兵 2 ( Sentinel -2) 影 像 和 由 其 衍生 的 一 阶 微分 、 
二 阶 微分 影像 各 提取 23 种 对 叶绿素 敏感 的 宽 波段 光谱 指数 ,加 入 3 种 影响 植物 生长 的 土壤 参量 (土壤 含水 量 ,十 
壤 有 机 质 ,土壤 电导 率 ) 作 为 影响 叶片 SPAD 的 特征 变量 ,再 根据 以 上 特征 变量 对 每 种 植被 叶片 各 建立 3 种 方案 的 
SPAD 估算 模型 ,从 而 实现 对 绿洲 内 植被 叶绿素 的 监测 。 结 果 表 明 :GD 影像 经 一 阶 微分 再 提取 的 植被 指数 相 比 原 
位 光谱 植被 指数 ,在 SPAD 估 测 模型 中 起 到 了 更 重要 的 作用 ,在 随机 森林 算法 的 重要 性 排序 中 位 居 前 列 ;@ 4 种 村 
被 叶片 的 SPAD 估 测 模型 都 取得 了 不 错 的 效果 ,芦苇 叶片 尤为 显著 ,确定 系数 (及 ) 达 到 了 0.926;@ 分 析 对 比 3 种 
方案 下 模型 预测 能 力 ,方案 3( 包 含 土壤 参量 ) 的 预测 能 力 卓 越 [2. 143 < 相对 百分比 偏差 (RPD) <2. 692.) ,其 预测 
能 力 排序 为 :方案 3 > 方案 1 > 方案 2, 土 壤 属 性 和 模型 预测 结果 有 较 强 的 非 线性 相关 。Sentinel -2 数据 具有 理想 
的 估算 绿洲 植被 叶绿素 含量 的 潜力 ,提供 了 一 种 高 效 、 低 成 本 、 洪 在 高 精度 的 方案 来 估算 叶绿素 含量 ,可 为 干旱 区 
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叶绿素 是 光合 作用 过 程 中 吸收 光 能 的 植被 色 — Bi, MODIS , Landsat, HJ — 1 , ASTER , QuickBird 等 多 
素 , 更 是 植被 (尤其 在 衰老 期 ) 光合 作用 能 力 的 指 ”光谱 遥感 数据 已 成 功 应 用 于 植被 理化 参数 的 监 
征 ,已 成 为 监测 绿洲 植被 生长 健康 状况 的 重要 的 生 WS ,但 它们 通常 缺少 “ 红 边 ”信息 ,这 对 植被 
BEB BO 。 大 量 研究 表明 植被 叶片 的 叶绿素 相对 ”SPAD 的 遥感 估算 是 极为 不 利 的 。 欧 洲 太空 局 于 
= 含量 (SPAD ) 可 直接 用 以 衡量 其 实际 叶绿素 含量 的 2015 年 6 月 发 射 的 哨兵 2 5 (Sentinel -2) 多 光谱 传 
© 高 低 ” -7 。 植 被 是 绿洲 生态 系统 的 重要 组 成 成 分 ， ” 感 器 ,具有 最 高 可 达 10 m 分 辩 率 .可 覆盖 13 个 光谱 
获取 SPAD 这 一 植被 典型 的 生化 参数 并 进行 系统 性 ”波段 的 遥感 数据 "9 。 此 外 ,Sentinel -2 数据 也 是 目 
研究 ,可 以 及 时 掌握 绿洲 生态 系统 的 发 展 动向 中 。 ”前 唯一 一 个 在 “ 红 边 ”范围 含有 3 个 波段 的 多 光谱 
干旱 区 绿洲 植被 叶片 叶绿素 含量 及 时 准确 地 估算 及 ”数据 ,对 监测 植被 健康 信息 非常 有 效 。Clevers °° 
诊断 , 对 制定 科学 的 水 肥 管理 措施 及 进行 干旱 状况 。 对 3 种 多 光谱 影像 的 “ 红 边 ”指数 组 合 进行 了 比较 ， 
评估 具有 重要 的 现实 意义 。 受 叶片 中 叶绿素 吸收 作 ÆT Sentinel -2 的 大 豆 红 边 叶绿素 指数 (Clre) 与 
用 的 影响 ,农作物 叶片 在 “ 红 边 "位置 (690 ~780 ”其 叶绿素 浓度 具有 极 高 相关 性 (RR =0.94)。Ver- 
nm) 存 在 着 明显 的 光谱 响应 ,这 使 得 利用 遥感 技术 ”relst 等 "9 使 用 了 4 种 机 器 学 习 算 法 在 Sentinel - 2 
对 SPAD 进行 遥感 估算 成 为 了 可 能 。 常 见 的 “ 红 边 ” ”的 “ 红 边 ”范围 内 估算 植被 叶绿素 ,RR 达到 了 0.99。 
参数 包括 : 红 边 位 置 、. 红 边 幅 值 ` 红 边 峰 值 等 ") 。 目 。 ”此 外 , 李 粉 玲 等 "使 用 模拟 高 分 1 号 的 遥感 光谱 指 
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数 在 关中 地 区 建立 了 冬小麦 叶片 SPAD 估算 模型 ， 
指出 基于 随机 森林 算法 构建 的 模型 具有 最 优 精 度 。 
这 些 研 究 成 果 证 明了 Sentinel -2 的 空间 分 辨 率 和 
光谱 特性 在 SPAD 遥感 估算 上 的 可 行 性 ,与 机 器 学 
习 算 法 的 结合 克服 了 样 点 数量 较 少 .数据 分 布 不 均 
等 不 利 条 件 。 然 而 ,上 述 研究 多 在 非 干 旱地 区 开展 ， 
且 大 多 只 利用 单一 红 边 参数 建 模 ,没有 深入 考虑 土 
坏 属 性 的 多 种 重要 协 变量 , 对 干旱 区 绿洲 植被 
SPAD 的 建 模 效果 有 待 进一步 的 考证 。 

基于 此 ,本 研究 以 渭 干 河 一 库 车 河 绿 洲 ( 渭 一 
库 绿 洲 ) AE IE HEX, SEF Sentinel -2 数据 和 原 位 
SPAD 数据 ,设立 3 种 组 合 方案 并 利用 随机 森林 算 
法 构建 了 区 域 棉花 芦苇 AKE USE A 种 典型 植被 
叶片 的 SPAD 估算 模型 ,以 期 为 干旱 区 植被 叶绿素 
含量 的 无 损 监 测 以 及 当地 精准 农业 提供 数据 支持 和 
技术 支撑 。 


1 数据 与 方法 


1.1 研究 区 概况 

渭 一 库 绿洲 (40°50’ ~ 41°38'N ,81°26' -83?17'E) 
位 于 新 疆 南 部 阿克苏 地 区 ,天 山南 肪 中段 塔里木 盆 
地 北 缘 ,塔里木 河中 游 ( 图 1)。 绿 洲 涵盖 库 车 、 沙 
雅 ,新 和 3 县 ,是 典型 的 洪 积 - 冲积 倾斜 平原 ,境内 
北 高 南 低 , 平 均 海拔 971 m。 人 气温 日 较 差 大 ,2001 一 
2016 年 间 年 平均 气温 10.3 ~ 14.4 % ,最 高 气温 
41.5 "C ;潜在 蒸发 量 2 420 mm ,多 年 平均 降水 量 为 
43 mm, ZSE% 54: 1 ,降水 季节 性 差异 很 大 ,多 集 
中 于 6 一 7 月 ,其 他 月 份 降水 大 幅 减少 ,属于 干旱 与 
极端 干旱 区 ;土壤 主要 为 潮 土 . 草 甸 土 \. 风 沙土 、 盐 
土 ”-”。 区 域内 主要 水 系 为 渭 干 河 、 库 车 河 , 木 扎 
提 河 、 英 达 雅 河 及 塔里木 河 ,水 域 多 建 有 平原 水 库 ， 
如 库 车 跃进 水 库 、 沙 雅 齐 满 水 库 。 绿 洲 境内 为 该 地 
主要 农作物 产 区 ,人工 植 被 以 棉花 (Gossypium hirs- 
sittum) W} ( Populus L) XW} ( Ziziphus jujube ) 为 
主 ,天 然 植 被 以 芒 苇 (Phragmites australis ) 4% SE ll 
(Alhagi sparsifolia) . 464648 ( Karelina caspica ) 、 树 柳 
( Tamarix chinensis) $R JU ( Kalidium foliatum ) 等 内 
EH BN EO” 。 
1.2 实测 数据 

2017 年 10 月 8—19 日 ,在 渭 一 库 绿洲 进行 了 
野外 实地 调查 。 依 据 研究 区 地 表 形 态 和 地 貌 差异 
以 及 样 点 分 布 的 均匀 性 ,对 绿洲 范围 内 的 66 个 远 
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注 : 地 理 底 图 源 自 新 疆 维吾尔 自治 区 测绘 地 理 信息 局 
[ 审 图 号 :新 S(2016)118 号 ) ] ,未 对 边界 进行 修改 。 
图 1 研究 区 及 采样 点 


Fig.1 The study area and sampling sites 


离 其 他 明显 特征 (道路 ,河渠 ) 的 点 进行 采样 ,坐标 
通过 GPS 定位 并 记录 。 每 个 采样 点 测 取 了 叶绿素 
相对 含量 (SPAD) 表层 土壤 有 机 质 (soil organic 
matter, SOM ) 、 土 壤 含水 量 (soil moisture content, 
SMC) 以 及 土壤 电导 率 (electrical conductivity, EC ) 
等 数据 。 

1.2.1 植被 叶片 SPAD 值 使 用 日 本 美能 达 公 司 
生产 的 SPAD 快速 叶绿素 测定 仪 , 从 东 西南 .北方 
向 以 及 植株 冠 层 的 上 、 中 、 下 ,采集 25 片 健康 .规则 
的 叶片 测定 SPAD 值 ,并 将 25 个 测定 值 的 算术 平均 
值 作为 对 应 采样 点 特定 植被 叶片 的 SPAD 值 。 

1.2.2 植被 叶片 光谱 ”植被 叶片 光谱 数据 由 ASD 
Field Spec 4 测量 便携 式 光谱 仪 测定 ,测定 时 利用 植 
被 探头 与 叶片 夹 和 光谱 仪 自 带 光源 ,将 每 个 样 点 
(25 片 ) 的 每 片 叶片 测定 2 次 ,注意 避 开 叶脉 ,保证 
叶片 平整 且 被 探测 的 面积 相同 。 采 集结 束 后 ,对 光 
谱 数 据 进行 Savitaky-Golay 滤波 ,以 去 除 噪声 并 对 光 
谱 曲 线 进行 平滑 ,然后 取 均 值得 到 该 样 点 的 叶片 光 
谱 

1.2.3 土壤 含水 量 ”对 每 个 采样 点 使 用 5 点 采样 
法 采集 5 个 15 cm 土 层 的 土 样 , 共 采 集 330 个 土壤 
样品 ,记录 周边 环境 信息 。 在 实验 室 ,将 土壤 样本 置 
于 105 的 恒温 烘 干 箱 内 烘 48 h ,然后 对 同一 采样 


Tog 


点 土壤 水 分 实测 值 求 平均 值 , 得 到 该 采样 点 的 真实 
土壤 含水 量 。 
1.2.4 土壤 有 机 质 ”将 采集 的 土 样 在 实验 室 自然 
风干 .研磨 ,并 剔除 土 样 中 的 杂质 后 过 0. 25 mm FL 
径 筋 。 采 用 重 铬 酸 钾 容量 法 - 外 加 热 法 ( 油 浴 ) 测 
定 分 选 好 的 土壤 有 机 质 含量 。 
1.2.5 土壤 电导 率 每 组 土 样 称 取 3 份 样品 ,每 份 
为 0.5 g, 将 每 份 样品 置 于 消 煮 管 中 , 用 去 离子 水 定 
PRE 20 mL ,将 所 有 消 煮 管 放置 在 摇 床 上 ,震动 处 理 
1 h, $$ E 30 min, 采用 德国 Wissenschaftlich Tech- 
nische Werkstätten 公司 生产 的 Cond 7310 电导 仪 测 
定 , 并 将 3 份 样品 的 电导 率 求 平 均 , 得 到 该 组 土 样 的 
ip x Um, 
13 影像 数据 

根据 实地 采样 时 间 和 采样 范围 ,选择 2017 年 
10 H 14 日 的 2 X Sentinel -2A 影像 (以 下 简称 
S2A) ,数据 来 源 于 欧洲 太空 (http://www. esa. 
in/ESA) 。 影 像 基 本 无 云 , 质 量 高 。 获 得 的 S2A 多 
光谱 影像 数据 类 型 是 Level - 1C ,是 已 经 过 几何 校正 
的 反射 率 数据 ( 表 1)。 


表 1 本 研究 使 用 的 S2A 数据 
Tab.1 S2A data used in this study 
卫星 数 
N0205_R062_T44TPL_20171014T052639 2017-10-14 S2A 13 
N0205 R062 T44TPM 20171014T052639 2017-10-14 S2A 13 


影像 编号 获取 日 期 


1.3.1 图 像 预 处 理 ”使 用 ENVI5.5 软件 对 影像 进 
行 地 形 校正 、 辐 射 定 标 和 Flaash 大 气 校 正 , 获 得 其 
反射 率 数据 。 从 表 2 和 图 2 可 以 看 出 ,S2A 波段 的 
空间 分 辩 率 不 一 致 ,本 文 使 用 3 次 卷 积 内 插 方 法 将 
大 气 校正 后 的 波段 重 采样 至 效果 最 好 的 10 m 空间 
分 辨 率 。 最 后 ,使 用 GS ( gram-schmidt pan sharpe- 
ning) 融 合 方法 将 2 幅 影 像 拼 接 ,并 按照 研究 区 范围 
进行 裁剪 。 

1.3.2. 植被 影像 反射 率 的 提取 和 精度 ”使 用 大 气 
校正 处 理 后 的 影像 ,其 植被 光谱 显示 了 绿色 植被 光 
谱 的 典型 趋势 (图 2)。 蓝 波段 (490 nm) 和 红 波 段 
(665 nm) 显 示 出 2 条 吸收 带 , 即 光 辐 射 光合 作用 形 
成 2 个 叶绿素 吸收 层 ; 在 绿 波段 (560 nm) 下 小 的 反 
射 峰 代表 了 绿叶 植物 叶绿素 对 绿 光 的 强烈 反射 效 
应 ;在 705 ~783 nm 范围 内 ，“ 红 边 ” 明显 并 且 在 近 
红外 波段 ( 865 nm ) 形 成 了 更 高 的 反射 峰 。 利 用 大 
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Tab.2 Spectral bands and resolutions of S2A sensors 


HN S2A 空间 分 

ae 中 心 波长 /nm ”波段 宽度 /nm 辩 率 /m 
海岸 波段 (B1) 443.9 21 60 
蓝 波段 (B2) 496.9 98 10 
绿 波段 (B3) 560.0 45 10 
红 波段 (B4) 664.5 38 10 
植被 红 边 1 波段 (B5) 703.9 19 20 
植被 红 边 2 波段 (B6) 740.2 18 20 
植被 红 边 3 波段 (B7) 782.5 28 20 
近 红 外 波段 (B8) 835.1 145 10 
近 红 外 波段 (B84) 864.8 33 20 
水 汽 波段 (B9) 945.0 26 60 
卷 云 波段 (B10) 1 373.5 75 60 
短波 红外 1(B11 ) 1 613.7 143 20 
短波 红外 2(B12 ) 2 202.4 242 20 
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图 2 大气 校正 前 后 的 植被 像 元 反射 率 


Fig.2 Reflectance of vegetation pixels before and 


after correction 


TIE TEP AL USS T OS E SS DS BUR WI , ,恢复 了 
植被 光谱 曲线 的 典型 趋势 。 

根据 现场 测量 的 CPS 坐标 ,将 位 于 S2A 中 的 采 
样 点 控制 在 一 个 像 元 中 。 和 采样 点 的 GPS 坐标 位 于 
两 个 或 多 个 像素 的 边界 处 ,将 相 邻 像 元 的 光谱 反射 
率 的 平均 值 作 为 样本 点 的 影像 反射 率 ; 坐 标 位 于 像 
元 的 中 心 位 置 , 将 像 元 的 光谱 反射 率 认 定 为 样本 点 
的 影像 反射 率 。 如 图 3 所 示 ,S2A 每 组 波段 光谱 响 
应 效果 较 好 的 位 置 并 不 在 波段 中 心 波长 位 置 处 ， 
此 要 将 样本 点 的 光谱 仪 实测 反射 率 重 采样 ,与 S2A 
各 波段 光谱 响应 较 好 的 波长 位 置 匹配 ,然后 根据 该 
点 的 影像 反射 率 , 按 如 下 公式 求 出 建立 植被 指数 所 
需 各 波段 的 反射 率 相对 误差 : 


R; -Ra 


ia 


E. = 


i 


x 100% (1) 


ia 
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图 3 S2A 影像 的 波谱 响应 关系 


Fig.3 Spectral response relationship of S2A images 


RPE, 为 第 i 波段 的 相对 误差 ;R, 是 第 i 波段 对 应 
的 实测 光谱 反射 率 ; Ra 是 第 i 波段 对 应 的 大 气 校正 
后 的 光谱 反射 率 22) 。 结 果 表明 ,图 像 处 理 可 以 获得 
接近 实测 的 叶片 光谱 ( 表 3) ,这 为 后 续 分 析 提 供 了 
保证 。 


RI 植被 叶片 光谱 反射 率 与 实测 反射 率 间 的 相对 误差 


Tab.3 Relative errors between vegetation canopy spectral 


reflectance and measured reflectance /% 

植被 B2 B3 B4 B5 

ES 14. 07 36. 47 2.07 3. 86 
棉花 17.31 22.97 16.14 11. 25 
Ke 12. 48 28. 62 7.83 10. 51 
杨 树 19. 77 27. 83 35.14 7. 63 
植被 B6 B7 B8 B8A 
ES 10.86 2.14 2.83 10.29 
棉花 9.14 6.77 8.52 9.37 
KE 8.32 6.98 5.24 8.73 
TW 9.97 12. 70 15.40 10. 50 


1.3.3 构建 和 选择 植被 指数 ”植被 指数 是 将 遥感 
影像 上 不 同 波段 的 光谱 反射 率 使 用 线性 或 非 线 性 组 
合 , 得 到 反映 植被 某 种 特征 信息 的 指数 。 植 被 叶片 
光谱 曲线 在 “ 红 边 ”范围 出 现 的 急速 上 升 的 陡坡 ,是 
一 阶 导 数 光 谱 曲 线 在 该 区 间 内 的 拐点 。 考 虑 到 
植被 光谱 特性 和 S2A 影像 的 “ 红 边 ”优势 ,建立 23 
个 植被 指数 *-” ,并 对 研究 区 的 S2A 影像 进行 一 
阶 ` 二 阶 求 导 ( 图 4) ,再 分 别 建 立 相 应 的 23 种 指数 
关系 ( 表 4) 。 


1.4 构建 估算 模型 

分 别 建立 对 采样 点 棉花 芦苇 BS E 
的 SPAD 佑 算 模 型 ,从 现场 随机 抽取 的 总 样本 中 , 随 
机 选取 总 数 75% 的 样本 建立 估算 模型 。 其 他 25% 
的 样本 用 于 模型 试验 ( 表 5)。 

随机 森林 算法 (random forest，RF) 作 为 一 种 较 
新 的 集成 学 习 算法 ,可 以 综合 利用 多 种 特征 变量 建 
模 并 评价 。 将 野外 测 得 的 植被 冠 层 SPAD 值 作为 因 
变量 ;植被 指数 系列 1( 原 影像 的 23 个 植被 指数 )， 
植被 指数 系列 2( 原 一 阶 微分 影像 .二 阶 微分 影像 的 
23 个 植被 指数 ) ,土壤 参数 (SOM SMC, EC) 分 别 作 
为 自 变 量 。 设 立 3 种 方案 ( 表 6) ,在 matlab 中 利用 
随机 森林 回归 算法 分 别 对 采样 点 的 4 种 植被 ( 棉 
花 芦 苇 ,大 现 \ 杨 树 ) 建 立 植被 叶片 SPAD 的 估算 模 
型 。 

为 了 消除 不 同 植被 指数 .土壤 参量 之 间 的 量 纲 
影响 ,对 数值 进行 归 一 化 处 理 ,使 各 数值 处 于 同一 数 
量 级 ,以 便 进行 综合 对 比 评价 。 归 一 化 函数 为 : 


a — min, 
(2) 


a, = i 
max, — min, 


式 中 ;a 为 需要 进行 归 一 化 处 理 的 数据 ;a, 为 归 一 化 
后 的 样本 数据 ;max, 为 a 中 的 最 大 值 ;min, 为 a 中 
的 最 小 值 。 归 一 化 后 的 数值 范围 是 [0,1]。 
1.5 特征 重要 性 评分 

在 随机 森林 模型 中 ,通过 选择 原始 数据 集 和 
训练 数据 集 ( 即 校准 数据 集 ) 的 随机 样本 ,使 用 确定 
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注 :(a) 为 假 彩色 (B84 ,B4 ,83 ) 合 成 的 S2A;(b) 为 一 阶 微分 影像 同 假 彩 色 波段 组 合 一 致 的 SAi;(e) 为 二 阶 微分 影像 同 假 彩色 波段 组 合 一 致 的 S2A。 
图 4 不 同 预 处 理 后 的 S2A 数据 
Fig.4 S2A data after different pretreatments 


表 4 植被 指数 
Tab.4 Vegetation indexes 
分 类 指数 全 称 计算 公式 
NDVI 归 一 化 植被 指数 (B8A — B4)/(B8A + B4) 
RVI 比值 植被 指数 B8A/ B4 
etico D DVI 差 值 植被 指数 B8A-B4 
CI, 叶绿素 指数 - 绿色 B8A/B3 -1 
CVI 叶绿素 植被 指数 B8A x BA/ B3? 
€ Saleen 1.5(1. 2(B8A - B4) -2.5(B4 - B3)) 
E (2B8A +1)? - (6B8A - 5 /B4) -0.5 
NDVIrel 红 边 归 一 化 植被 指数 1 (B8A - B5)/(B8A + B5) 
NDVIre2 红 边 归 一 化 植被 指数 2 (B8A - B6)/(B8A + B6) 
NDVIre3 红 边 归 一 化 植被 指数 3 (B8A - B1)/(B8A + B7) 
NDrel 红 边 归 一 化 差 值 1 (B6-B5)/(B6+ B5) 
NDre2 红 边 归 一 化 差 值 2 (B7-B5)/(B7+ BS) 
TClrel 红 边 三 角 叶 绿 素 指 数 1 1.2(B5 - B3) -1.5(B4 - B3) A 
TClre2 红 边 三 角 叶绿素 指数 2 1.2(B6 - B3). -1.5(B4 - B3) A 
TChe3 红 边 三 角 叶绿素 指数 3 1.2(87-B3) -1.5(B4 - B3) , | #2 
TCARIrel 红 边 转化 叶绿素 吸收 反射 率 指 数 1 3( (B5 - B4) -0. 2(B5 - B3) B5/B3 J 
红 边 指数 (5 -29] TCARIre2 红 边 转化 叶绿素 吸收 反射 率 指 数 2 3( (B6 - B4) -0. 2( B6 - B3) B6/B3 ) 
TCARIre3 红 边 转化 叶绿素 吸收 反射 率 指数 3 3( (87 - BA) -0.2(B7 - B3) BT/B3) 
B8A/BS -1 
MSRrel 修正 的 简单 比率 1 | Fay 
B5 
B8A/B6 -1 
MSRre2 修正 的 简单 比率 2 B8A 
(Be +1) 
B8A/B7 -1 
MSRre3 修正 的 简单 比率 3 (m 4D 
Clrel 红 边 叶绿素 指数 1 B8A/B5 -1 
Clre2 红 边 叶绿素 指数 2 B8A/B6 -1 
Clre3 红 边 叶绿素 指数 3 B8A/B7 -1 
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m5 建 模 方案 
Tab.5 Modeling plans 
植被 类 型 样本 总 数 训练 样本 数 估算 样本 数 


棉花 40 30 10 
pag 45 34 11 
杨 树 23 17 6 
大 更 30 23 7 


A6 ”实验 方案 信息 


Tab.6 Information of experimental programs 


实验 方案 特征 组 合 
1 植被 指数 系列 1 
2 植被 指数 系列 1 + 植被 指数 系列 2 
3 植被 指数 系列 1 + 植被 指数 系列 2 + 土壤 参数 


性 算法 构建 每 颗 树 。 需 要 在 随机 森林 模型 中 确定 3 
个 参数 :NN 是 从 原始 数据 集中 抽取 的 IN 个 集合 用 于 
生成 回归 树 的 数量 (默认 值 为 500 棵 树 ) ;天 是 从 N 
个 训练 集中 提取 的 天 个 特征 变量 (默认 值 是 总 数据 
HEAY 66. 67% ) ;六 是 从 K 个 总 特征 变量 中 选取 的 最 
有 具 重 要 性 的 X 个 特征 参数 作为 每 棵 树 的 分 类 节点 
(XK)。 此 外 ,在 抽取 训练 集 X 过 程 中 ,未 被 抽取 
部 分 称 为 袋 外 数据 (out-of-pag, OOB ) ,使 用 此 部 分 
数据 计算 内 部 误差 (00B 误差 ) ,00B 误差 越 小 ,说 
明 随 机 森林 模型 的 分 类 精度 越 高 。00B 误差 也 可 
以 计算 特征 变量 的 重要 性 ,将 需要 计算 的 一 个 特征 
变量 改变 并 保持 的 其 他 特征 变量 不 变 ,计算 被 改变 
特征 变量 前 、 后 OOB 误差 的 差 值 和 百分比 , 即 为 判 
断 该 特征 变量 重要 性 的 依据 。 其 评估 模型 如 下 : 
VOL) 23, (8 BY) 


式 中 :WVW 表示 特征 变量 的 重要 性 ;WW 为 样本 的 全 部 
特征 数 ;N 为 生成 的 决策 树 的 棵 数 ;B, 为 任意 特征 
值 M, 未 加 入 噪声 干扰 时 第 i 棵 决策 树 的 OOB ix 
差 ;B, 为 任意 特征 值 M 加 入 噪声 干扰 时 第 上 棵 决 
策 树 的 OOB 误差 。 特 征 变量 的 重要 性 VI. 值 越 大 ， 
则 说 明 特 征 M, 对 分 类 结果 的 影响 越 大 。 
1.6 模型 精度 检验 方法 

本 研究 利用 估算 样本 对 基于 不 同 输入 变量 的 模 
型 精度 进行 检验 ,并 使 用 以 下 指标 评估 模型 效 
OU :确定 系数 ( 尼 ) 、 均 方 根 误差 (RMSE) 、 相 对 百 
分 比 偏差 (RPD) 。 本 研究 中 ,R 包括 建 模 集 的 确定 
系数 (Rcal) 和 验证 集 的 确定 系数 (Rval)。RMSE 
包括 建 模 集 的 均 方 根 误差 (RMSE) 和 验证 集 的 均 
方 根 误差 (RMSE, ) 。 采 用 3 类 标准 评估 模型 的 可 


预测 性 , 即 I (RPD >2.2) 具 有 良好 的 可 预测 性 ; 
了 [类 (2.0 < RPD «2. 2) RA rp BE n] BU T ; MAS 
(RPD <2. 0) AA ia ny wp c ECT, 


2 结果 与 分 析 


2.1 特征 重要 性 分 析 

在 本 研究 中 , 当 树 的 数量 (N) 为 500 时 , 袋 外 误 
差 00B 基本 收 紧 并 趋 于 稳定 ,因此 ,所 有 实验 方案 
的 入 为 500,K 为 335 ,XX 则 设 为 2。 上 文中 的 方案 1 
和 方案 2 均 为 对 照 实验 ,不 需要 做 特征 变量 的 重要 
性 评价 , 故 在 方案 3 的 基础 上 ,对 参与 建 模 的 72 个 
寺 征 变量 进行 特征 重要 性 评价 ,并 选取 前 31 个 得 分 
较 高 的 重要 性 生成 重要 性 分 布 图 (图 5)。 

在 4 种 植被 叶片 的 SPAD 估算 模型 中 ,棉花 、 芦 
苇 、 京 树 的 一 阶 指数 的 重要 性 都 是 各 自 建 模 特征 中 
占 比 最 大 的 ,尤其 是 芦苇 ,达到 了 42% ; 而 土壤 参量 
虽然 只 有 3 个 特征 变量 (SMC .SOM EC ) 参 与 , 占 所 
有 特征 变量 总 数 的 4.17% ,在 每 种 估算 模型 中 贡献 
的 重要 性 都 高 于 6% ,特别 是 杨 树 叶片 的 SPAD 估算 
模型 ,其 占 比 达到 了 15% , 且 SMC 和 EC 是 重要 性 
前 2 位 的 特征 变量 ,分 别 到 达 了 5.43% F 5. 0196 
(图 6)。 可 见 , 土 壤 参 量 对 植被 叶片 的 叶绿素 相对 
含量 有 较 强 的 响应 。 
2.3 叶片 SPAD 值 模型 估算 结果 

在 所 有 植被 叶片 SPAD 估算 模型 中 ,从 方案 1 
到 方案 3 的 建 模 集 效果 逐步 提升 , Roa 逐渐 增 大 ， 
RMSE. 也 呈现 出 逐渐 变 小 的 趋势 (图 7)。 加 入 微分 
影像 的 植被 指数 和 实测 土壤 属性 后 , 建 模 效果 显著 
提高 。 在 预测 效果 方面 ,所 有 估算 模型 的 RPD 都 达 
到 了 本 类 标准 ,具有 中 度 及 以 上 的 可 预测 性 ,但 与 建 
模 集 效果 都 逐渐 提高 的 情况 不 同 , 芦 苇 、 吏 树 、 杨 树 
叶片 SPAD 估算 模型 的 验证 集中 , 相 比 方案 1 ,方案 
2 的 RPD 反而 减 小 ,其 可 预测 性 出 现 了 下 降 的 情 
况 , 尤 其 是 芦苇 叶片 SPAD 佑 测 模型 的 RPD 值 ,由 
方案 1 的 2.620 又 降 到 方案 2 的 2.009 ,模型 的 可 预 
测 性 也 从 良好 变 成 了 中 等 ,可 能 是 方案 2 加 入 的 植 
被 指数 较 多 ,导致 了 部 分 特征 变量 元 余 ,降低 了 模型 
的 预测 效果 ( 表 7)。 此 外 , 杨 树 叶片 SPAD 估算 模 
型 的 方案 2,R 仅 比方 案 1 提升 了 0.01, 但 其 RM- 
SE, 却 增 大 了 0.724,RPD 下 降 了 0.014 ,可 见 其 方 
案 2 的 模型 整体 效果 较 方 案 1 下 降 。 而 所 有 植被 在 
方案 3 的 验证 效果 却 都 是 3 种 方案 中 最 优 的 , 尺 最 


ChinaXiv 合 作 期 刊 


201909.00056v1 


chinaXiv 


重要 性 得 分 重要 性 得 分 
0 2 4 6 8 0 2 4 6 
Ist CI 2nd NDrel pnr] 
SM! ist DV EE 
2nd TCARIrel lst NDI Fd 
2nd Clre3 lst TCARIre2. SSA 
2nd MSRre3 SMO = 
2nd CIrel 1st TCARIrel 
Ist DVI Ist NDre2 [—— — — — — 7 
Ist. TCARIre3 [eJ 
1st TCARIre2 lst TCIre2. J] 
1st TCIre3 lst_CIre2 三 
1st Clrel 2nd Clrel — —l 
2nd MSRrel Tig] 2nd MTVI2 三 
4X 2nd TCARIre2 EX 1st, NDVIre2. A 
E qs TCARIrel is Nps c 
st_TCARIre 25 St. red | pee 
Ist TClre3 (a) Pit # — 2nd MSRre2 E—————4 (b) Fs 
1st NDVIre3 lst_TCIre3 和 
Cir EG. [— — ——1 
TCARIre2 lst Clrel C 
NDVIre2 E Cs pem 
TCIrel TCARIre3 [— — ——3 
TCARIre1 2nd TCARIrel PP —— — —] 
E NDre2 [二 
2nd NDVI 2nd_TClIrel 于 | 
2nd_MTVI2 NDVI | 
2nd_TCIrel 2nd NDVIrel [— — —] 
2nd DVI DVI ^ | 
2nd NDre2 [— — —]] 
lst Clre3 TCARIre2 [|] 
NDVIrel 1st NDVirel [| 
MTVI2 2nd CVI[ | 
Al 
重要 性 得 分 重要 性 得 分 
0 2 4 6 8 0 2 4 6 
1st, NDVI SMC. el 
2nd_MTVI2 6 
SMC 1st. NDVIre3 [C 
SOM TOlrel (TT 
Clre3 soM — — — — — ————— 
1st_NDVIre3 2nd MSRre3 站 
MSRre3 nd Clre3 
1st. NDVIrel 1st TCARIre3 Fe — — —] 
1st NDVIre2 2nd Clre2 [LL] 
NDVIre2 2nd TCrel| ^  — J 
1st Clrel CARIel| ^ 
bi re3 MSRre3 [LS] 
EX RVI #8 2nd NDVIre2 于 
id Clre2 H nd TClre3 [LL 
s. 1st TCARIre3 "5 2nd NDVrel| ^ 
ük TCIre2 Ist_NDrel [— — — — —3J 
CARICO S Teres M 
TCARIre: st TCIre3 Fe ———— —] 
Ist, NDre2 (©) 棉花 cre3 © (D 杨 树 
MSRre2 2nd Chlel| ^ 
NDVIre3 |[ — — 
2nd NDrel lst NDVI [— — —3 
lst NDrel TCARIe2 [| — — 
2nd RVI 2nd_NDVI [|  — 7) 
lst ' a SI 2nd TCARIrel | | 
2nd | NDVI | MTVI2 记 
t Clre2 MSRr2| —  ] 
lst ' TORRIGI DY = = 
MS. rel 2nd CLg | |] 
TOlre3 [| 1] 
2nd TCARBe NDrel [| 
注 :1st 表示 已 经 过 一 阶 导 之 后 的 影像 ,2nd 表示 经 过 二 阶 导 之 后 的 影像 。 
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Jut fT L Rr MZ 
估算 值 进行 回归 拟 合 。 分 布 图 估算 值 与 实测 数据 的 
0 


图 6 


Fig.6 Proportions of characteristic importance 


杨 树 


寺 征 重要 性 


占 比 


拟 合 方程 决定 系数 尼 H 0. 826, RMSE 为 3.794 , 结 
果 表 明 ,基于 估算 模型 的 植被 叶片 SPAD 值 空间 分 
布 与 实测 值 基本 一 致 。 
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SPAD 估算 模型 ,以 此 类 推 。R?cal 表示 建 模 集 自 
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集 的 均 方 根 误差 ,RPD 是 验证 集 的 相对 百分比 


22 SPAD 表示 叶绿素 相对 含量 。 
到 7 叶片 SPAD 预测 值 与 实测 值 分 布 


型 绿洲 植被 叶绿素 含 
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TE: M 代表 棉花 叶片 江 代 表 芦 苇 叶 片 , 匡 代 表率 树叶 片 ,Y 代表 杨 树叶 。1 代表 方案 1,2 代表 方案 2,3 代表 方案 3,Ml 是 方案 1 的 棉花 叶片 
的 确定 系数 ,R val 表示 验证 集 的 确定 系数 ,RMSEc 表示 建 模 集 的 均 方 根 误差 ,RMSEV 表示 验证 


Fig.7 Distribution of estimated and measured leaf SPAD values 


3 讨论 


SPAD 值 反 映 了 植被 叶片 单位 表面 积 的 叶绿素 
含量 ,并 可 以 表征 植被 叶片 . 冠 层 的 养分 和 长 势 状 
它 与 植被 叶片 的 反射 光谱 之 间 存 在 较 强 的 相关 
征 波段 构建 光谱 指数 在 不 同 程度 上 降 
低 了 由 环境 变化 而 引起 的 反射 率 误差 ,可 以 用 来 定 


性 四 ,选取 特 


量 反 演 植被 的 理化 参数 。 


(1) 结合 图 1 和 图 8 ,绿洲 SPAD 值 的 空 
大 体 上 为 内 部 高 ,四周 低 , 且 受 水 系 的 影响 较 大 。 河 
流水 系 及 水 域 周边 植被 的 叶绿素 含 
50 ~60 之 间 ,而 研究 区 西北 角 处 叶绿素 较 高 且 没 有 
主要 水 系 , 可 能 是 由 于 暂时 性 灌溉 导致 的 。 要 对 
间 尺 度 上 进行 更 深入 


SPAD 在 空 


间 分 布 


量 明显 较 高 ,在 


A lr ,除了 掌握 主 
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表 7 ME SPAD 预测 值 与 实测 值 分 布 
Tab.7 Distribution of estimated and measured 


leaf SPAD values 
植被 。 方案 建 模 集 验证 集 
类 型 7 Ry — RMSE, Rba — RMSE, RPD 
方案 1 0.829 3.004 0.825 3.476 2.045 
棉花 “方案 2 0.858 — 2.638 — 0.843 2.646 2.626 
方案 3 0.894 2.471 0.881 2.290 2.692 
方案 1 0.912 2.528 0.864 2.159 2.620 
方案 2 0.918 2.419 0.913 2.380 2.009 
方案 3 0.9322 2.436 0.932 1.913 2.484 
方案 1 0.823 3.977 0.832 3.995 2.032 
方案 2 0.875 3.290 0.871 3.002 2.001 
方案 3 0.946 3.042 0.926 3.085 2.457 
方案 1 0.863 3.979 0.788 3.927 2.035 
杨 树 ”方案 2 0.889 3.959 0.798 4.651 2.021 
方案 3 0.943 3.500 0.907 3.039 2.143 
注 :Reu 表 示 建 模 集 的 确定 系数 ;Ra 表示 验证 集 的 确定 系数 ;RMSEc 
表示 建 模 集 的 均 方 根 误差 ;RMSEV 表示 验证 集 的 均 方 根 误差 ;RPD 
是 验证 集 的 相对 百分比 偏差 。 
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Fig.8 Spatial distribution of leaf SPAD values at greenup stage 


要 自然 水 系 ,还 应 掌握 该 地 的 灌溉 区 划 。 

(2) 利用 多 光谱 数据 对 叶绿素 的 遥感 估算 ,以 
往 研 究 选取 的 光谱 指数 类 型 较 少 ,对 叶绿素 敏感 的 
红 边 光谱 指数 更 少 ”) 。 本 文选 取 23 种 光谱 指数 参 
与 模型 构建 ,发现 基于 多 个 植被 指数 的 SPAD 估算 
模型 效果 (RR 大 0.8) 明 显 好 于 以 往 基 于 单个 植被 指 
数 的 SPAD 估算 模型 。 且 基于 “ 红 边 ”的 光谱 指数 对 
估算 模型 起 到 了 更 为 关键 的 作用 ,更 能 反映 叶绿素 
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较 高 时 的 吸收 差异 。 而 在 一 阶 微分 影像 上 建立 的 传 
统 光 谱 指数 (1st_DVI,1st_NDVI,1st_RV1) ,在 模型 
中 的 重要 性 比 在 原 影像 上 (DVI,NDVI,RVI) 有 了 大 
幅 提升 。 这 是 由 于 植被 反射 光谱 在 “ 红 边 ”处 的 和 斜 
率 变化 剧烈 ,一 阶 微 分 影像 的 光谱 指数 反映 出 了 
“陡坡 ”上 下 的 斜率 差异 。 本 文 使 用 的 指数 是 在 前 
人 的 植被 指数 模型 基础 上 结合 S2A 构建 的 ,并 未 深 
入 研究 光谱 指数 的 机 理 , 致 使 部 分 重要 性 偏 低 的 指 
数 也 参与 了 模型 构建 ,如 芦苇 叶片 在 绿 波段 (B3) 与 
实测 光谱 相对 误差 达到 了 36. 47% , 绿 波段 (B3 ) 参 
与 构建 的 植被 指数 导致 模型 的 预测 能 力 偏 低 ,今后 
需 在 优选 特征 的 基础 上 进行 模型 构建 。 

(3) 除 光谱 指数 外 ,土壤 属性 也 对 预测 结果 有 
较 大 影响 。 在 估算 模型 加 入 土壤 含水 量 (SMC ) , E 
SUR LIB (SOM ) .土壤 电导 率 (EC)3 个 土壤 参量 
后 ,可 预测 性 显著 提高 ,特别 是 SMC 在 4 种 植被 叶 
片 SPAD 的 估算 模型 中 ,重要 性 都 在 前 5 位 ,可 见 ， 
将 易 获 取 的 土壤 参量 加 入 模型 能 提升 估算 精度 。 

(4) 本 文采 用 的 随机 森林 回归 算法 是 估算 植被 
生物 量 的 优选 方法 2 。 它 能 最 大 程度 地 综合 多 种 
特征 变量 ,因此 影像 数据 覆盖 的 范围 越 广 ,空间 分 辩 
率 和 光谱 分 辩 率 越 高 ,模型 效果 越 好 。 且 随机 森林 
算法 能 给 出 不 同 变量 对 模型 的 影响 评分 ,这 替代 并 
且 升 华 了 以 往 线性 模型 的 相关 性 ,还 可 将 模型 优选 
出 的 重要 性 排序 靠 前 的 特征 变量 与 估算 对 象 做 更 深 
入 的 研究 。 构 建 的 模型 实现 了 一 定 范围 .特定 时 间 上 
的 SPAD 值 的 快速 估算 ,但 实现 更 大 范围 更 高 精度 的 
SPAD 值 估 算 还 需要 利用 多 年 的 新 数据 加 以 改进 。 


4 结论 


在 12 个 基于 随机 和 森林 回归 算法 的 植被 叶片 叶 
绿 素 相 对 含量 (SPAD ) 估算 模型 中 ,所 有 红 边 指数 
和 土壤 属性 参数 的 组 合 展现 出 最 佳 SPAD 预测 能 
力 ,芦苇 叶片 表现 效果 最 佳 (Re 20.932, RMSE, = 
2. 436, Ri, = 0. 932, RMSE, = 1. 913, RPD = 
2.484) 。 而 一 阶 微分 指数 和 土壤 含水 量 (SMC ) 在 
随机 森林 重要 性 排序 中 ,与 SPAD 具有 显著 非 线性 
关系 。 依 据 该 模型 制作 的 研究 区 植被 叶片 SPAD 3€ 
感 监测 专题 图 ,实现 了 植被 叶片 SPAD 值 在 空间 尺 
度 上 的 表达 ,为 多 光谱 遥感 监测 植被 叶绿素 含量 提 
供 了 参考 。 综 上 所 述 ,S2A 数据 具有 较 强 的 预测 绿 
洲 植被 SPAD 值 的 潜力 ,基于 多 种 光谱 指数 和 土壤 
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Abstract : 


a. The method of Random Forest with a comparative advantage in machine learning was chosen to model and esti- 


The Ogan-Kuga River Delta Oasis ,a typical oasis in the arid zone in China, was taken as the study are- 


mate the relative contents of chlorophyll (SPAD values) of leaves from four kinds of representative vegetation ( cot- 
ton , reed, poplar and jujube). The 23 broadband spectral indices of vegetation, which are sensitive to chlorophyll 
content , were obtained based on the reflectance of original Sentinel - 2 image with rich spectral information in the 
"red edge" bands. These vegetation indices were extracted again in the original band order on the firstly-derived 
Sentinel -2 image and secondly-derived Sentinel -2 image. Three soil parameters (soil moisture content , SMC ; soil 
organic matter , SOM ; electrical conductivity , EC) related to vegetation growth were all conducted as the characteris- 
tic variables affecting SPAD values. According to the characteristic variables above, three modelling schemes could 
be developed to monitor the SPAD values of vegetation leaves in oasis. The results showed that; (I) Vegetation indi- 
ces obtained from the firstly-derived image played a more important role than the original vegetation indices in the 
SPAD estimation model. (2) It could be concluded that SPAD-RF regression model , based on the Sentinel — 2 satel- 
lite image data , could be used to effectively monitor the SPAD values of leaves of the four vegetation types. Especial- 
ly for the estimation model of SPAD of reed leaves, R^ reached 0. 926. (3) By analyzing and comparing the model 
prediction capability under the three schemes ,the prediction capability of scheme 3 ( including soil parameters) was 
excellent (2. 143 « relative percentage deviation ( RPD) « 2. 692) , and the prediction capability was ranked as 
scheme 3 > scheme 1 > scheme 2. There was a significant nonlinear correlation between the soil properties and the 
model prediction results. Holistically , Sentinel ~ 2 data has great potential for predicting chlorophyll content of oasis 
vegetation. This study provided an efficient , low-cost , potentially high-precision solution to estimate SPAD. 
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